1
Определение стандартной формы выпуклой задачи
MATH008Lesson 4
00:00

Задача выпуклой оптимизации в стандартной форме является основой современного математического программирования. Она определяется выпуклой целевой функцией $f_0$, выпуклыми неравенствами $f_i$ и аффинными равенствами. Определив задачу на пересечении этих областей $\mathcal{D} = \bigcap_{i=0}^m \text{dom } f_i$, мы гарантируем, что любое локальное оптимальное решение является глобальным.

1. Математическая структура стандартной формы

Задача формально формулируется следующим образом:

$$\begin{aligned} &\text{минимизировать} && f_0(x) \\ &\text{при условии} && f_i(x) \leq 0, \quad i = 1, \dots, m \\ &&& a_i^T x = b_i, \quad i = 1, \dots, p \end{aligned}$$

Допустимое множество определяется как $\text{dom } F = \{x \in \text{dom } f_0 \mid f_i(x) \le 0, i = 1, \dots, m, h_i(x) = 0, i = 1, \dots, p \}$. Критическое требование для выпуклости заключается в том, что равенства должны быть аффинными ($Ax = b$), поскольку нелинейные равенства обычно приводят к невыпуклым множествам.

2. Геометрическая интерпретация эпиграфа

Эта задача в форме эпиграфа позволяет нам геометрически интерпретировать оптимизацию в «пространстве графика» $(x, t)$. Введя переменную-дополнение $t$, мы минимизируем $t$ при условии $(x, t) \in \text{epi } f_0$. Это показывает, что допустимое множество, любое подуровневое множество и оптимальное множество являются по своей сути выпуклыми.

3. Ошибка скрытых (неявных) против явных ограничений

Распространённое заблуждение состоит в том, что перенос ограничений в целевую функцию (сделав их неявными) упрощает задачу. Однако, сделать ограничения неявными не сделало задачу проще для анализа или решения, даже если результатом становится задача с номинально отсутствующими ограничениями. Это особенно верно в случае модели оракула (черного ящика), где мы вычисляем $f(x)$ и её производные с определённой стоимостью, не зная явной структуры функции.

4. Применение в реальном мире

  • Теория портфеля: Минимизация риска $\text{var}(c^T x) = x^T \Sigma x$ для 4 активов (например, Актив 1 с доходностью 12% / стандартным отклонением 20%).
  • Инженерные задачи: Структурные ограничения, такие как $y_i = 6(i - 1/3) \frac{F}{E w_i h_i^3} + v_{i+1} + y_{i+1}$.
  • Теория вероятностей: Ограничения на риск потерь $\Phi^{-1}(\beta) \leq 0$.
🎯 Основной принцип
Условие оптимальности для дифференцируемой функции $f_0$ задается как $\nabla f_0(x)^T(y - x) \geq 0$ для всех допустимых $y$. Это означает, что градиент должен быть опорной гиперплоскостью для допустимого множества в оптимальной точке.